菜鸟团一周文献推荐(No.8)
今后如果没有特殊情况,生信菜鸟团成员将每周为大家带来一期文献速递,推荐我们过去一周看到的好文献。所有的推荐完全不独立公正第三方,只是根据个人喜好推荐,希望对你有所帮助。(因为假期本周的文献推荐就是一次特殊情况)
欢迎大家阅读完毕之后在文章最后选出你认为最感兴趣的文章,就可能在下一周看到这篇文章更详细的解读和测评哈,赶紧动手转发推荐给你的朋友一起投票参与,笔芯
推荐人: kaopubear
Benchmarking of alignment-free sequence comparison methods
DOI(url):
https://doi.org/10.1101/611137
发表日期:April 16, 2019.
关键点
有哪些 alignment-free (AF) 相关的工具,以及如何评价。
参考意义
AF 类的工具,在转录组分析层面使用最多的是定量分析。例如 salmon 和 kallisto,主要原理就是基于对kmer的各种操作。其实除了转录组的快速定量
这篇文章比较详细的介绍了目前主要 AF 相关工具的原理和工具。同时,作者使用了24个相关软件的74种方法,测试了五种应用场景,分别是:
protein sequence classification
gene tree inference
regulatory element detection
genome-based phylogenetic inference
reconstruction of species trees under horizontal gene transfer and recombination events
作者还提供了一个在线工具,用来展示这些结果。
推荐人: kaopubear
Bazam: a rapid method for read extraction and realignment of high-throughput sequencing data
DOI(url):
https://doi.org/10.1186/s13059-019-1688-1
发表日期:18 April 2019
关键点
bam 文件似乎可以方便的回滚了
参考意义
随着参考基因组的更新和比对方法的更新,很多之前的bam文件似乎就变得过时了。除了找出原始的fastq文件再重新来过一次,现在有了另一个选择。
bazam 首先可以从bam或者cram文件直接找到pair reads 在比对回其它参考基因组而不需要中间步骤; 也可以按需要提取过滤后的reads,例如与特定基因位置有overlap的reads。结果可以直接传到下游工具,或以fastq格式存储以供进一步处理。另外还从read 这个input层面提供了多线程比对的思路。加快了比对速度。
整体而言,和目前已有的一些可以转换bam文件的工具相比,其在内存和存储占用,已经方便程度上都有优势。
目前我的问题是很多时候会对原始bam文件进行一波过滤,这个时候已经丢掉了很多fastq的reads。
相关内容
其它几个已有工具的比较
Sort-Extract-Realign | 282 GB | 20 GB | 16 | 13 h, 15 min |
Picard SamToFastq | 148 GB | 78 GB | 16 | 16 h, 14 min |
Biobambam bamtofastq | 149 GB | 30 GB | 16 | 15 h 30 min |
Bazam (no sharding) | 68 GB | 28 GB | 16 | 14 h, 55 min |
Bazam 10-way sharding | 102 GB | 20 GB | 160 | 1 h, 11 min |
推荐人:kaopubear
Antisense lncRNA Transcription Mediates DNA Demethylation to Drive Stochastic Protocadherin α Promoter Choice
DOI(url):
https://doi.org/10.1016/j.cell.2019.03.008
发表日期:4 April 2019
关键点
反义 lncRNA 转录可以影响DNA甲基化,进而改变染色体结构促进增强子与启动子结合,调控基因表达。
参考意义
Pcdhα基因有13个可以随机启动的可变外显子,每个启动子都可以由自身的启动子驱动,还有3个c型外显子以及稳定表达的编码pcdh结构域的外显子,同时,还有一个enhancer调控。
研究者发现,反义lncRNA的转录,会造成该位点DNA去甲基化的发生,从而使远端增强子靠近该外显子的启动子,促进它的表达。如图2所示,Pcdhα基因座位均带有抑制表达的DNA甲基化修饰,而当反义lncRNA表达时,该外显子附近的DNA被DNA去甲基化酶TET3识别,去除了甲基化修饰,cohesin蛋白重塑了染色体的结构,HS5-1增强子与该基因座位的启动子结合,启动相应Pcdhα变体的表达。
相关内容
关于反义lncRNA影响正义链基因表达的作用机制,主要有3类
反义lncRNA的转录过程,抑制正义链基因的转录,该机制认为反义链转录事件本身,而不是反义lncRNA,调控了基因的表达。
反义lncRNA结合DNA或组蛋白修饰酶,调控所在基因座位的表观遗传学,从而影响正义链基因的表达。
反义lncRNA与正义链mRNA通过碱基互补配对结合,影响mRNA的可变剪接等。
推荐人:kaopubaer
exceRpt: A Comprehensive Analytic Platform for Extracellular RNA Profiling
DOI(url):
https://doi.org/10.1016/j.cels.2019.03.004
发表日期:April 4, 2019
关键点
一套分析 exRNA 的完整方案
参考意义
exRNA 就是细胞外RNA,也就是在细胞内转录但是在细胞外发挥功能。最近cell 有一个专刊介绍了很多exRNA的文章,我扫了一眼,感觉主要内容是小RNA居多。所以这个分类和lncRNA类似,一个从长度一个从位置来进行区分。既然是这样,exRNA 的处理方法应该就和小RNA以及一般的 RNAseq 分析类似。看看这个流程里面有哪些不一样的地方。这里提供的分析方法从内容来看主要针对小RNA,但是官方说也可以很方便的移植到其它RNA,在GitHub的代码里也有针对 longRNA 的脚本。主要流程如下图,质控后会同时比对到多个数据库,具体内容可以参考 GitHub。
醒醒,假期结束了胖友,投票